#aprendizaje automático

Mecanismo SuperActivador: Transformers concentran señales de concepto en cola

Los SuperActivadores: tokens de cola en Transformers que señalan conceptos con alta fiabilidad, mejorando la detección en 0.14 F1. ¡Descubre el mecanismo!

2026-06-01 · 3 min

Inyección ruido secuencial subespacios evita colapso desaprendizaje certificado

La inyección de ruido secuencial en subespacios evita colapso de precisión en desaprendizaje certificado. Mejora la utilidad del modelo.

2026-06-01 · 3 min

De pesos a código: extrayendo algoritmos interpretables del Transformer Discreto

Extrae algoritmos interpretables de un Transformer Discreto. Descubre cómo convertir pesos neuronales en código legible para una IA más explicable.

2026-06-01 · 3 min

Interacciones estructuradas mejoran coordinación distribuida más que escalado

Descubre cómo reestructurar la comunicación entre robots mejora un 47% el rendimiento, frente al 9% de escalar modelos. Estudio con 10 robots reales.

2026-06-01 · 2 min

LLMs sin Deep Learning: Arquitectura RBF con Óptimo Global

LLMs sin Deep Learning: nueva arquitectura RBF que encuentra el óptimo global en una iteración, eliminando el tedioso entrenamiento.

2026-06-01 · 1 min

Ingeniería Autónoma de Datos con Agentes para Especialización de Modelos

Descubre cómo los LLM actúan como ingenieros de datos autónomos para especializar modelos, logrando mejoras de rendimiento de hasta 57%.

2026-06-01 · 2 min

Un marco unificado para la agregación de gradientes en optimización multiobjetivo

Descubre un marco teórico que unifica los algoritmos de agregación de gradientes para optimización multiobjetivo, con nuevas garantías de convergencia y aplicac

2026-06-01 · 2 min

Mezcla de Expertos en GNN Condicionada por Grafos para Pronóstico de Tráfico

GC-MoE asigna expertos congelados personalizados a cada nodo vial, mejorando precisión en pronóstico de tráfico con solo 17K parámetros.

2026-06-01 · 3 min

Estimación mejorada de distribuciones en norma infinito

Descubre cómo mejoramos la estimación de distribuciones discretas bajo norma infinito con nuevas cotas minimax y resultados empíricos prometedores.

2026-06-01 · 2 min

LARK: Selección de trayectorias de razonamiento basada en aprendibilidad

Descubre LARK: selecciona trayectorias de razonamiento basadas en la aprendibilidad del estudiante para una destilación eficiente. ¡Optimiza tus modelos!

2026-06-01 · 1 min

CobSeg: Modelado de Límites de Coherencia para Segmentación de Diálogos

CobSeg mejora la segmentación de temas en diálogos sin LLM. Reduce errores en benchmarks. Ideal para apps humano-IA.

2026-06-01 · 2 min

Alineación humana, calibración y patrones en la incertidumbre de LLMs

Descubre cómo los LLMs reflejan la incertidumbre humana mediante alineación, calibración y patrones de activación. Un estudio clave para entender y combatir alucinaciones.

2026-06-01 · 2 min

dashi: Biblioteca Python para caracterización de cambios en conjuntos de datos

Descubre dashi, la librería Python para analizar deriva de datos. Mejora la confiabilidad de tu IA con métricas y visualizaciones.

2026-06-01 · 2 min

Análisis sintáctico neuro-simbólico: red neuronal con algoritmo CYK

Descubre cómo la inyección del algoritmo CYK en redes neuronales supera a LLMs de 20B en análisis sintáctico. ¡Un salto neuro-simbólico!

2026-06-01 · 2 min

Verificación detallada con razonamiento diagnóstico para extracción de tripletes de sentimiento

FiVeD: verificación de grano fino para mejorar la extracción de tripletes de sentimiento. Aumenta F1 hasta 3.53. Ideal para sistemas de opinión.

2026-06-01 · 3 min

Modelos visuales suprimen género femenino en imágenes ambiguas

Investigación revela que VLMs suprimen representaciones femeninas en imágenes ambiguas, incluso en ocupaciones estereotipadas femeninas. Conoce la métrica LALS.

2026-06-01 · 2 min

Cabezas de Atención Posicional vs Simbólica: Dinámicas y Generalización

Descubre cómo las cabezas de atención posicionales y simbólicas aprenden en Transformers, su geometría RoPE y generalización de longitud.

2026-06-01 · 2 min

Unificación y optimización de valores de datos en selección secuencial

Descubre cómo un nuevo enfoque unifica y optimiza la valoración de datos usando decisiones secuenciales, mejorando la selección en LLM y benchmarks clásicos.

2026-06-01 · 1 min

ProofWala: Framework de Síntesis y Demostración Multilingüe

Descubre ProofWala, un framework open-source para síntesis de pruebas multilingüe y demostración de teoremas con IA. Acelera tu investigación.

2026-06-01 · 2 min

Inferir eventos de series temporales con modelos de lenguaje

Descubre cómo los modelos de lenguaje infieren eventos a partir de series temporales usando datos deportivos. Un nuevo benchmark y técnicas de destilación mejoran el rendimiento.

2026-06-01 · 2 min